## [1] 14236 474
Análisis descriptivo
Nuestro conjunto de datos tiene las siguientes dimensiones: 14236, 474. De las 474 variables, 464 de ellas corresponden al valor de la intensidad de señal que llega al movil desde cada punto de acceso inalámbrico WAP y las otras 10 variables corresponden a posición desde donde se ha tomado la señal e identificación del usuario y teléfono móvil utilizado.
Resúmenes descriptivos
Vamos a mostrar los datos a modo de tabla, pero únicamente mostraremos algunas de las variables WAP, ya que son demasiadas.
- Formato de cada variable:
## 'data.frame': 14236 obs. of 9 variables:
## $ LONGITUDE : Factor w/ 679 levels "-7300.818990092725",..: 489 480 441 453 553 468 441 462 499 421 ...
## $ LATITUDE : Factor w/ 687 levels "4864745.745015971",..: 514 553 598 551 644 576 598 528 426 593 ...
## $ FLOOR : Factor w/ 5 levels "0","1","2","3",..: 3 3 3 3 1 3 3 3 3 3 ...
## $ BUILDINGID : Factor w/ 3 levels "0","1","2": 2 2 2 2 1 2 2 2 2 2 ...
## $ SPACEID : Factor w/ 123 levels "1","2","3","4",..: 31 31 28 27 47 30 28 26 37 28 ...
## $ RELATIVEPOSITION: Factor w/ 2 levels "1","2": 2 2 2 2 2 2 2 2 2 1 ...
## $ USERID : Factor w/ 18 levels "1","2","3","4",..: 2 2 2 2 11 2 2 2 2 2 ...
## $ PHONEID : Factor w/ 16 levels "1","3","6","7",..: 15 15 15 15 8 15 15 15 15 15 ...
## $ TIMESTAMP : POSIXct, format: "2013-06-20 09:35:33" "2013-06-20 09:34:51" ...
En primer lugar, vamos a hacer un breve análisis descriptivo de las variables que no corresponden a las señales WAP.
## LONGITUDE LATITUDE FLOOR BUILDINGID
## -7367.458799999207 : 88 4864841.782799996: 88 0:3247 0:3091
## -7360.497299998999 : 85 4864837.920500003: 85 1:3582 1:3767
## -7312.662200000137 : 82 4864807.624899998: 82 2:3127 2:7378
## -7311.919399999082 : 78 4864808.963799998: 78 3:3743
## -7345.42330000177 : 75 4864829.557700001: 75 4: 537
## -7366.2424000017345: 74 4864841.108000003: 74
## (Other) :13754 (Other) :13754
## SPACEID RELATIVEPOSITION USERID PHONEID
## 107 : 349 1: 2785 11 :3703 13 :3703
## 104 : 337 2:11451 7 :1353 14 :2028
## 202 : 324 1 :1114 6 :1353
## 106 : 316 2 :1058 23 :1058
## 101 : 315 10 : 893 8 : 893
## 102 : 303 14 : 773 7 : 773
## (Other):12292 (Other):5342 (Other):4428
## TIMESTAMP
## Min. :2013-05-30 12:15:24
## 1st Qu.:2013-06-20 09:35:24
## Median :2013-06-20 10:21:10
## Mean :2013-06-17 05:53:31
## 3rd Qu.:2013-06-20 11:40:49
## Max. :2013-06-20 16:15:45
##
Gráficas
Visualización del campus
Análisis de los edificios
Encontramos 3 edificios y 5 plantas diferentes, pero eso no tiene porque indicar que todos los pisos tengan 5 plantas.
Es interesante destacar que la mayoría de mediciones se han tomado en el edificio con identificador 2 y en la posición relativa delante de la puerta, no dentro de las habitaciones.
## BUILDINGID
## FLOOR 0 1 2
## 0 652 965 1630
## 1 759 898 1925
## 2 882 1105 1140
## 3 798 799 2146
## 4 0 0 537
En la tabla anterior observamos que el único edificio que tiene 5 plantas es el edificio número 2, y que los edificios 0 y 1 tienen 4 únicamente 5 plantas.
Vemos como en el edificio 2 es en el que se han tomado mayor número de mediciones y podría ser debido a que es el que más plantas tiene.
## BUILDINGID
## FLOOR 0 1 2
## 0 652 965 1630
## 1 759 898 1925
## 2 882 1105 1140
## 3 798 799 2146
## 4 0 0 537
Vemos que con gran diferencia, el edificio 2 es en el que mayor número de mediciones se han realizado.
Análisis de los usuarios
Observamos claramente como hay usuarios que suelen visitar edificios concretos, ya que la inmensa mayoría de los registros que hace son allí, como por ejemplo el usuario 11 en el edificio 0, aunque tambien visita las plantas 3 y 4 del edificio 2.
A continuación vamos a ver en que edificio ha registrado cada usuario el mayor número de visitas
## USERID count BUILDINGID
## 1 1 1114 1
## 2 2 609 3
## 3 3 192 3
## 4 4 320 2
## 5 5 599 3
## 6 6 583 3
## 7 7 730 3
## 8 8 298 3
## 9 9 265 3
## 10 10 543 3
## 11 11 1977 3
## 12 12 433 3
## 13 13 108 3
## 14 14 572 3
## 15 15 497 3
## 16 16 299 3
## 17 17 524 3
## 18 18 226 3
Observamos que los únicos usuarios que han registrado posición en el edificio 0 son el 1 y el 11, pero cabe destacar que el usuario 11 también es el único que ha registrado señal en los tres edificios y el 1 únicamente en el edificio 0.
Conclusión: no todos los usuarios visitan todos los edificios.
Número de medidas tomadas por cada usuario:
Vemos que hay un usuario en concreto que registra una cantidad de mediciones muy superior al resto, y este es el usuario número 11, con un total de 3703.
Análisis de la posición relativa
Vamos a estudiar a continuación como ha variado el número de mediciones en función de la posición relativa de la toma.
Podemos observar como la mayoría de las mediciones han sido tomadas delante de la puerta, y son mucho menos las que han sido tomadas dentro de las habitaciones.
Análisis del espacio
Vamos a hacer un análisis de identificación de los espacios, y así poder ver si todos los edificios tienen los mismos espacios o se identifican unívocamente para cada edificio.
Identificación de los espacios según el edificio.
Aquí podemos ver el número de espacios que hay en cada edificio, y lo que nos hace pensar que no todos los edificios son igual de grandes, ya que el número de espacios del edificio 1 es inferior al resto, siendo el edificio 2 el que mayor número de espacios tiene, sobre todo en la planta 3.
¿Se repite el número de salas en función del edificio o cada edificio tiene sus propias salas?
## BUILDINGID
## SPACEID 0 1 2
## 1 0 42 0
## 2 0 69 0
## 3 0 64 0
## 4 0 72 0
## 5 0 48 0
## 6 0 56 0
## 7 0 28 0
## 8 0 32 0
## 9 0 47 0
## 10 0 82 0
## 11 0 16 0
## 12 0 12 0
## 13 0 21 0
## 14 0 12 0
## 15 0 20 0
## 16 0 27 0
## 17 0 20 0
## 18 0 15 0
## 22 0 10 0
## 25 0 3 0
## 26 0 14 0
## 27 0 14 0
## 28 0 17 0
## 29 0 17 0
## 30 0 7 0
## 101 30 158 127
## 102 58 131 114
## 103 33 129 139
## 104 37 151 149
## 105 36 93 128
## 106 44 133 139
## 107 48 124 177
## 108 39 99 135
## 109 39 57 107
## 110 45 81 113
## 111 50 66 111
## 112 44 53 139
## 113 41 42 112
## 114 51 10 93
## 115 48 14 92
## 116 36 53 67
## 117 47 48 100
## 118 45 12 129
## 119 52 13 113
## 120 59 0 115
## 121 48 12 138
## 122 53 12 161
## 123 46 0 59
## 124 41 0 147
## 125 45 0 135
## 126 58 0 168
## 127 40 0 141
## 128 60 0 143
## 129 40 0 179
## 130 47 0 127
## 131 23 0 99
## 132 25 0 134
## 133 29 0 153
## 134 34 0 116
## 135 14 0 99
## 136 17 0 169
## 137 15 0 121
## 138 25 0 86
## 139 10 0 141
## 140 12 0 215
## 141 0 0 63
## 142 0 0 5
## 143 0 0 103
## 144 0 0 13
## 146 0 0 5
## 147 0 0 7
## 201 47 131 106
## 202 45 210 69
## 203 37 118 92
## 204 41 75 81
## 205 43 37 72
## 206 38 83 98
## 207 35 41 87
## 208 45 28 75
## 209 49 27 72
## 210 36 40 44
## 211 42 18 59
## 212 40 26 47
## 213 40 16 36
## 214 52 6 138
## 215 34 14 68
## 216 50 80 60
## 217 41 47 56
## 218 62 8 55
## 219 55 8 37
## 220 45 8 39
## 221 36 0 37
## 222 52 42 16
## 223 42 0 45
## 224 45 7 87
## 225 43 7 27
## 226 39 9 14
## 227 38 25 16
## 228 33 20 16
## 229 47 20 15
## 230 46 20 26
## 231 51 19 15
## 232 10 0 16
## 233 18 0 15
## 234 46 0 16
## 235 41 13 16
## 236 31 0 26
## 237 14 28 17
## 238 0 32 16
## 239 0 16 16
## 240 0 0 15
## 241 18 0 27
## 242 0 0 26
## 243 0 17 25
## 244 0 35 16
## 245 0 14 16
## 246 0 14 17
## 247 0 59 23
## 248 0 68 16
## 249 0 25 0
## 250 0 0 15
## 253 0 0 7
## 254 0 0 6
Las salas de la 101 a la 122 se repiten para todos los edificios, sin embargo para el edificio 1, las salas de la 1 a la 30 son exclusivas de éste.
Las salas con identificadores 123-140 se repiten para los edificios 0 y 2, pero no existen (o no se han tomado registros) para el edificio 1.
j
Número de medidas tomadas por cada teléfono:
## .
## 1 3 6 7 8 10 11 13 14 16 17 18 19 22 23 24
## 495 599 1353 773 893 433 497 3703 2028 192 175 320 583 701 1058 433